利用无标注文本构建词向量模型, 结合特定领域的关键词信息, 提出一种词义消歧方法。以环境领域的待消歧文本作为评测语料, 通过与Lesk等其他消歧方法进行比较, 证明了所提方法的有效性。通过引入不同的领域知识, 证明该方法亦可在其他领域的文本消歧任务中加以应用。
在搜索引擎中对用户问题直接给出简要的答案(即答案摘要)可以帮助用户更快捷的获取信息。针对这一任务, 设计一种基于特征的答案摘要抽取方法。为了进行句子相似性的计算, 提出通过使用卷积神经网络表示句子语义和计算相似性, 同时给出基于最大间隔学习的网络训练方法。在百度知道问答语料上的实验结果表明, 所提出的答案摘要抽取方法能够生成质量良好的简短回答。与基于词袋的相似性计算相比, 使用卷积神经网络能够更好地描述句子语义, 计算问题和句子之间的相似性, 有效地改善答案摘要的质量。